专访 | 黄书剑:如何评价机器翻译质量的好坏?
如今,人工智能的时代大势引发了深刻的技术革命、教育变革和数据革命,同时翻译技术也成为了翻译教学和实践中不可分割的部分,进一步推动了语言服务行业和高校教育的创新变革,促进了技术与人的和谐共生。为提升语言服务行业各方对翻译技术的认识和应用能力,加强语言服务人才的技术素养,加速语言技术成果的高效转化,整合当前优质和有效的翻译技术资源,推动翻译技术与翻译教学的融合发展,促进政、产、学、研的协同创新,WITTA翻译技术教育研究会(TTES)特别策划了【大咖专栏】,本期专栏将聚焦“机器翻译和译后编辑”,对话业界和学界的专家教授,聆听业内名家的精彩观点,洞见未来翻译技术发展趋势。
本期专访嘉宾是南京大学计算机科学与技术系副教授,博士生导师黄书剑老师。让我们来听听他对机器翻译的看法。
李
随着机器翻译的不断发展,有关其译文的质量备受关注,您如何看待目前机器翻译的译文质量呢?您认为机器翻译还存在哪些进步空间呢?
黄
随着资源的逐步上升,目前机器翻译的质量有了非常显著的提升,技术上其实已经达到非常成熟的程度。对于资源丰富的语言,比如在商业中使用的机器翻译系统中,中英数据量已经达到千万甚至上亿句对了,它的翻译质量已经非常不错了。但是也存在一些资源相对稀缺的语言对,这些语言对上的翻译质量可能还相对弱一些。总体上从翻译结果来说,资源丰富的语言的质量已经能够让人接受了,而资源稀缺的语言就不太容易取得比较理想的效果,比如有些词还不认识,有些句子还翻不对。
所以从提高机器翻译的角度,现在学术界研究的主要问题是如何在这些资源相对匮乏的语言对上,也能构建出比较成熟有效的机器翻译系统。当然,除了绝对的资源丰富和匮乏之外,也存在一些相对资源匮乏的场景。比如我们现在要做一个法律文书的翻译系统,虽然中英这个语言对上已经有非常多的平行数据了,但是在法律文书这个特定领域上,可能也仍然存在资源相对比较少的情况,所以在这些相对比较少的领域上的翻译质量也还有进一步提升的空间。
李
目前可以采用哪些方法对机器翻译质量进行评估呢?有没有最佳方案?
黄
对于机器翻译的质量评估问题,目前这是一个学术界正在研究的问题。应该说还没有特别成熟可靠的方案。从学术的角度来看,质量评估跟翻译其实是并行的两个问题。比如译者如果有能力进行翻译,对应的也应该有能力去判断翻译好不好,这两个能力其实应该是相辅相成。
目前有一些比较常见的评估方法,比如对翻译结果的句子是否通畅进行一些评估,或者是根据某些特定的检查点,比如有些固定的单词有没有翻对等可以做一些评估。除此之外,学术界也在研究一些整体性的方案。现在深度学习在人工智能当中比较火,学术界也在研究利用深度学习技术的一些方案,核心思想主要是利用大规模数据中包含的知识。假设中英我们有一千万的平行句对,利用这些句对当中包含的翻译知识,也可能来帮我们检查某个特定的翻译结果是否正确。这些问题也还在研究当中,有一些系统已经能达到一定的评估效果,但目前就准确性而言,还没有达到非常成熟的地步。
李
这些评估方法是否可靠呢?在具体案例中是否会受到其他因素影响呢?
黄
上述回答中已经提到一些简单的方法。其实这些简单的方法,在实际应用中往往是比较有效的。比如特定的命名实体翻译是否正确,这一点很容易检查,并且能接收到很好的效果。对于之前提到的相对比较复杂的方案,比如基于深度学习的方案,它可以整体上评估翻译质量,但是由于深度学习的可解释性现在是一个比较大的问题(也就是说我们可以知道这个句子大概翻的不太好,但具体哪儿不好或者为什么不好,目前还没能进行特别有效的说明),所以这个方案还在研究当中,那么什么时候能够具体投入使用呢?我们也拭目以待。
李
我们也了解到,针对以上提到的问题,有些公司提供了APE服务即自动修正服务来进一步提高机翻质量,您认为还可以采取哪些方法来进一步提高机翻质量呢?
黄
关于APE自动修正服务,它其实也是在训练一个翻译系统,只不过它的翻译的输入是一个机器翻译系统的翻译结果,输出是一个更新或者修正过后的翻译结果。原则上来说完成这样一个自动修正的系统也需要大量的知识和数据,也就是说我们需要从数据中学习如何进行改正。而学习的效果也受到数据的规模等方面的限制。目前可以看到APE有一定的效果,但是能否真正能达到实用的需求目前也处于在探索当中,这里主要原因还是在于数据中包含的知识是否足够的问题。
对于进一步提高机器反应的质量,我认为有三个角度。上面的回答也有涉及,第一是增大数据资源,第二是要针对性地开发特定领域的翻译知识,第三就是从技术上做一些提升以综合各种不同的知识。比如说一本专业词典能否对翻译有很大帮助?这在人工翻译过程中,答案是很显然的。但是对机器来说,还存在一些技术上进行提升的空间,这个问题在机器翻译当中也得到了广泛的关注。
李
随着神经机器翻译不断发展,机器翻译质量不断提高,您认为未来机器翻译质量评估会有什么发展呢?
黄
对于未来机器翻译评估的发展,原则上来说,如同刚才提到过的:评估和翻译是并行的两个能力。一方面翻译能力在增长,另一方面评估的能力也应该在增长。所以我认为随着神经机器翻译不断发展,不只是翻译质量提高,我们的评估能力也会相应提高。翻译和评估两者之间应该是有更好的补充或者辅助的关系。但这一点在目前还存在不足,我们希望这两个共同提高的系统能够有各自不同的关注方向,从而二者能够更好的互补,而现在看来,他们同质性相对高了一些。
李
在机器翻译质量不断提高的同时,您认为译者应该具备什么样的能力以适应这种变化呢?
黄
其实这个问题我认为从机器翻译产生开始就已经存在了。从机器翻译加入到翻译生产行业以来,译者朋友们的工作方式就在不断的发生变化。我觉得大的趋势是大量重复的、简单的工作将慢慢被机器所掌握。机器代替人来做这些重复劳动,而译者就需要去解决更难的、更有挑战性的、更复杂的或者更容易混淆的问题。这样的趋势对译者本身的素质水平有了更高的要求,当然我想同时也给了译者朋友们更广阔的提升空间。
访谈人 介绍
黄书剑
博士,南京大学计算机科学与技术系副教授,博士生导师。毕业于南京大学,获得工学学士和博士学位。现任中文信息学会青年工作委员会执委,中文信息学会机器翻译专委会副主任,中国计算机学会中文信息技术专委会委员,主要研究方向包括自然语言处理、机器翻译、计算机辅助翻译、知识发掘等。发表论文三十余篇,其中包括ACL,EMNLP,AAAI,IJCAI等顶级国际会议。曾担任ACL,AAAI,IJCAI,EMNLP,NAACL等会议的PC或审稿人,担任CCMT2019程序委员会主席,NLPCC2016、CCL2018机器翻译领域主席,CWMT2017、CWMT2018评测委员会主席等。
各位同仁:
本团队希望从翻译与本地化项目经理的视角出发,调研语言服务企业对翻译管理系统的应用,诚邀您根据实际情况填写问卷。问卷内容不涉及个人隐私,仅做科学研究。若您对问卷结果感兴趣,可以在问卷中留下联系方式。也请您帮忙转发给有类似经历的朋友于同行,感谢您的参与和支持。世界翻译教育联盟(WITTA)翻译技术教育研究会(TTES)
问卷二维码
往期精彩回顾
用导图读论文 | 王华树 刘世界:人工智能时代翻译技术转向研究
职业翻译必备的计算机翻译辅助软件| 附网址